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Автоматные алгоритмы синтеза образов 


Рассмотрена задача синтеза и анализа простых геометрических объектов — примитивов, представленных в 
растровом формате. Разработано приложение, реализующее предложенные автоматные алгоритмы для 
распознавания и синтеза образов. 


Необходимость распознавания графических образов возникает при решении 
широкого спектра технических задач. В целом ряде приложений успех распознавания 
существенно зависит от того, насколько успешно распознан контур объекта. 

В частности, задачи контурного анализа выходят на первый план при переводе 
инженерно-технической документации из растрового формата в векторный. Системы 
автоматизированного проектирования (САПР) и инженерного документооборота уже 
доказали свою состоятельность как эффективный инструмент разработки и под- 
держки проектной документации в электронной форме. Однако огромное количество 
инженерно-технических материалов до сих пор хранится в бумажных архивах и 
обрабатывается устаревшими методами. По некоторым оценкам во всем мире имеет- 
ся более 8 миллиардов технических изображений, из которых менее 15 % хранится в 
электронном формате. Несмотря на то, что системы автоматизированного проектиро- 
вания существуют уже не один десяток лет, более 65 % технических изображений — 
это бумажные чертежи. 

На сегодняшний день существует несколько подходов к решению задачи 
векторизации: 

— автоматическая векторизация дает удовлетворительные результаты только на из- 
ображениях хорошего качества и, как правило, требует существенной доработки; 

— интерактивная векторизация, при которой оператор явным образом указывает 
преобразуемые объекты на растре, дает хорошие результаты, но требует больших 
временных затрат; 

— гибридные системы совмещают в себе возможности для работы как с растровыми, 
так и с векторными изображениями, но также требуют участия оператора в процессе 
векторизации. 

При решении задачи векторизации подзадачи анализа и синтеза примитивов 
возникают естественным образом. 

Целью работы является построение алгоритмов анализа растровых изобра- 
жений чертежей и алгоритмов синтеза векторного представления примитивов. 

Постановка задачи. Исходным описанием будем считать растр — прямо- 
угольное поле размером тхл, разбитое на единичные квадраты, окрашенные белым 
(0) или черным (Т) цветом — на котором представлены два типа примитивов. 
Ставится задача построения алгоритмов анализа и синтеза примитивов для создания 
векторного описания растровых изображений и их программная реализация. 
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Основные определения 


Описание объектов будем выполнять в алфавите непроизводных символов 
Г = {0,1,2,3,4,5,6,7} цепочечных кодов Фримена, физический смысл которых ясен из 


рис. 1. 


6 
Рисунок | — Непроизводные элементы 


Поскольку задачи распознавания векторных изображений во многом созвучны 
задачам распознавания лабиринтов автоматами [1], будем описывать алгоритмы в 
терминах автоматных моделей. Обозначим множество всех слов конечной длины в 
произвольном алфавите Х, включая пустое слово е, через Х’. Конечным автоматом- 
преобразователем (автоматом Мили) называется шестерка А = (5, Х, У, 6, А, 0), где $ — 
конечное множество состояний, Х — конечное множество входных символов 
(входной алфавит), У — конечное множество выходных символов (выходной алфа- 
вит), б — функция, определяющая следующее состояние, Л: 5хХ->У — функция 
выходов, $ЕЗ — начальное состояние. Функции 6 и Л одношаговые и обычным 
образом распространяются на слова конечной длины. Автоматом-распознавателем 
назовем пятёрку А = (5, Х, 6, чо, Е), где 5, Х, 6, 50 — те же объекты, что и в автомате 
Мили, а Ес $ — множество заключительных состояний. Автомат допускает входное 
слово р, если 0(50, р) Е Е. Множество слов, допустимых автоматом А, называется 
языком, распознаваемым автоматом А. Слово р называется периодическим, если его 


можно представить в виде р=р!, где р’ обозначает К раз повторенное слово ру, 
К=1,2, ...; наименьшее такое р, называется периодом слова р. 


Выделение объекта 


На этапе выделения объекта растровое изображение сканируется сверху — вниз 
и слева — направо до нахождения объекта — первой точки, имеющей цвет, отличный 
от цвета фона (обозначим её (х, у)). Для оконтуривания можно использовать один из 
вариантов алгоритма жука [2], в качестве которого выступает автомат, блуждающий 
по клеткам плоскости и имеющий возможность обозревать «ближайших соседей» 
клетки, в которой он находится. Составление слова описания выполняется на основе 
непроизводных элементов из алфавита У. 

Алгоритм оконтуривания состоит из следующих шагов: 

а) поиск «соседей» точки (х, у); «соседями» считаются чёрные клетки с 
координатами (х-—1, у), (х, у—1), (х-1, у-1), (х+1, у), (х, УНП), (Х+1, УТ (х-1, У+О, 
(ХТ, УП; 
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6) поиск наиболее подходящего соседа; поиск начинается с точки, которая 
является следующей (по ходу часовой стрелки) за предыдущей контурной точкой; 

в) добавление кода направления, по которому пошел жук, к слову описания 
образа. 

Алгоритм заканчивает свою работу по достижении начальной точки. Результат 
работы алгоритма — слово описания объекта. 

Данный алгоритм может быть реализован в виде конечного автомата, который 
мы будем называть сканером, блуждающего по среде [1], в качестве которой высту- 
пает бинарное поле ограниченного размера ихт. Автомат, находясь в ячейке (1, ]), 
1 = 1.... п, ] = 1,.... ш, обозревает окрестность этой ячейки, то есть ячейки с 
координатами (1-1, 1), (1-1, 1), (1, 1), @+1, }), (+), нь +П), а 0, +Ь О. 
Наблюдая в одной из них элемент изображения (в ячейке нулевое значение 
цветности), автомат выдаёт на выход соответствующий элемент из алфавита У в 
зависимости от взаимного расположения наблюдаемой ячейки и ячейки фиксации 
автомата. Автомат завершает свою работу, если в результате блуждания вдоль кон- 
тура фигуры он возвращается в стартовую точку. 


Алгоритмы автоматного синтёза и распознавания 
примитивов 


Одной из основных особенностей инженерных графических изображений является 
ограниченность набора используемых примитивов. Фактически, большая часть изображе- 
ний может быть описана в терминах отрезков прямых (в т.ч. ломаные и многоугольники) 
и фрагментов эллипсов. В силу того, что анализ и синтез выполняется средствами 
вычислительной техники, будем рассматривать только отрезки прямых с рациональным 
угловым коэффициентом. В силу симметрии растровой сетки можно ограничиться 
рассмотрением только прямых с угловым коэффициентом К <1. 

Для описаний оцифрованных прямых из дискретной геометрии [3] известен резу- 


т 
льтат о том, что для прямых с рациональным угловым коэффициентом А = — слово 
п 
описания периодично. В работе [4] доказана следующая теорема, дающая точное 
описание оцифрованных прямых в алфавите Фримена. Пусть 
а>0 


з 1 
0, а<0 (1 


яет(а) = 
Теорема: Если р(т/п) = 0102... И т < п, то = $1е1(т-п11 то4 п), 1 = 1,...,п. 
На основании этих соотношений построена система уравнений автомата, 
ы т 
порождающего слово описания прямой с любым угловым коэффициентом А =— . 
п 
5 =р5(@-П-+т]шоаи, $(0)=0 


У(Е) = епт —5(- 1), 1>1 (2) 
(0 =1 
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Обозначим автомат, описываемый такими уравнениями, через А(т/л). На рис. 2 
в качестве примера приведен граф переходов автомата А(3/7), генерирующего слово 
‘0101010’, которое описывает прямую у = (3/7)*х. 


око 


Рисунок 2 — Граф переходов автомата А(3/7) 


Отдельно выделяется прямая, соответствующая т = 0. В этом случае прямой, 
совпадающей с осью Ох, соответствует слово °00...0?. 

В силу симметрии переход к описанию полупрямых у = Кх с началом в точке (0, 0) 
при других углах наклона осуществляется простой перекодировкой. 

Таким образом, для любых ш и п мы можем синтезировать описание 
соответствующего отрезка прямой. 

Следует особо отметить, что поскольку автомат задается уравнениями, а не табли- 
цами, величины т и п не влияют на сложность реализации и емкостные характерис- 
тики алгоритма. 

Работа над построением автоматов, синтезирующих окружности и эллипсы еще 
ведется, и представляется вероятным, что для генерации линий второго порядка могут 
потребоваться более сложные связки автоматов. 

Все прямые с К = шла, 0 < м < п, описываются словами р(т/п), и можно пост- 
роить генерирующий все эти последовательности автомат А(п), входным алфавитом 
которого можно считать множество Х={0, 1.,..., п, }. Каждое из этих значений соот- 
ветствует некоторому значению т, с помощью которого автомат настраивается на 
генерацию слова р(т/п). 

Состояния автомата А(т/п) переобозначим и получим множество {(т, 0), 
(т, 1),...(т, п-Т)}. Переходы осуществляются, как и в исходном автомате А(т/п), по 


п 
любому хеХ. Множество состояний тогда есть 5 = (] 5, |.) {50} и 6(5, п) = (т, 0). 


п 

Обозначим через г„ начальное состояние автомата А(т/п). Тогда автомат А(п) 
можно представить в виде следующей схемы, приведенной на рис. 3. 

На основе автомата А(п) можно построить автомат-распознаватель, который 
будет сравнивать предложенное слово р(т/п) последовательно со всеми словами, 
генерируемыми автоматом А(п). Так как множество слов р(т/п) конечно и они 
периодические, то объединение таких слов является регулярным языком и сущест- 
вует автомат, распознающий этот язык. 


т=0 
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Рисунок 3 — Схема автомата А(п) 


К 


Рисунок 4 — Граф переходов автомата В(3) 


Автомат-распознаватель В(п), распознающий множество всех периодических 


К 
т 
слов „") ‚ К> О, и их начальных отрезков, проще представить в виде недетермини- 
п 


рованного автомата, полученного определённым обращением по выходам автомата А(п). 
Из состояния $0 переходы осуществляются по всем дугам по входу, равному 1 в сос- 
тояние (т, п), а из состояния (т, 1) в состояние (т,]) осуществляется переход по 
входу ©, если в А(п) был переход из (т, 1) в (п1,]) с выходом а. По всем неопределён- 
ным остальным входам из всех состояний осуществляется переход в особое «мертвое» 
состояние $, которое переходит в себя по всем входам. Заключительными состоя- 
ниями объявляются все состояния автомата, кроме начального $о и «мертвого» $5. 
Такой автомат распознаёт слова, описывающие все отрезки полупрямых, начинаю- 
щихся в начале координат (подразумевается, что один из концов отрезка тоже лежит 
в начале координат). Ниже приведен пример автомата В(п) при п =3. 
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Программная реализация алгоритмов 


На основании описанных алгоритмов была реализована версия программной 
системы распознавания растровых изображений. В системе реализован описанный выше 
алгоритм оконтуривания объектов с генерацией представлений в цепочечных кодах 
Фримена, а также алгоритм распознавания примитивов типа «отрезок прямой». Система 
предполагает возможность расширения и встраивания дополнительных алгоритмов. 

Для распознавания используется два варианта алгоритмов. Первым из них явля- 
ется способ проверки полного соответствия описания, сгенерированного автоматом- 
сканером, описанию прямой, сгенерированному автоматом, порождающим описания 
идеальных прямых. Второй способ является способом «ускоренного» распознавания, 
при котором слово описания проверяется на соответствие некоторым известным 
характеристикам дискретных прямых и совпадение описания с идеальным прообра- 
зом проверяется только на некотором заранее выбранном количестве точек. Второй 
способ работает несколько быстрее, но не может гарантировать правильность резуль- 
татов в целом ряде случаев. 


Заключение 


В работе предложены автоматные алгоритмы синтеза образов и распознавания 
отдельных примитивов. На этой основе разработано приложение, реализующее распо- 
знавание отдельных типов примитивов как предложенным автоматным способом, 
так и ускоренным способом на основе некоторых известных об оцифрованных пря- 
мых фактов, который, однако, не дает стопроцентной точности распознавания. 

Предполагается, что методы, изложенные в статье, могут быть развиты для 
построения комплексной системы, которая будет решать задачи анализа изображений, 
формирования образа и последующей генерации изображений в векторном формате, 
причем предусматривается как построение собственного языка синтеза изображений, 
так и возможность экспорта в некоторые существующие форматы векторной инженер- 
ной графики. 
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Автоматн! алгоритми синтезу образв 

Розглянуто задачу синтезу та аналйзу простих геометричних об’ектв — примтивв, що представлен! у 
растровому формате. Розроблено систему, що реаллзуе запропонован! автоматн! алгоритми розшзнавання 
та синтезу образив. 
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